Tableau 中的聚合函数 您所在的位置:网站首页 tableau exclude函数 Tableau 中的聚合函数

Tableau 中的聚合函数

2024-01-05 21:33| 来源: 网络整理| 查看: 265

本文介绍 Tableau 中的聚合函数及其用途。它还演示如何使用示例创建聚合计算。

为何使用聚合函数

聚合函数允许您进行汇总或更改数据的粒度。

例如,您可能想要准确知道您的商店在特定年度有多少订单。您可以使用 COUNTD 函数对您的公司具有的准确订单数进行汇总,然后按年对可视化项进行细分。

计算可能如下所示:

COUNTD(Order ID)

可视化项可能如下所示:

Tableau 中的可用聚合函数

聚合和浮点算法:有些聚合的结果可能并非总是完全符合预期。例如,您可能发现 Sum 函数返回值 -1.42e-14 作为列数,而您知道求和结果应该正好为 0。出现这种情况的原因是电气电子工程师学会 (IEEE) 754 浮点标准要求数字以二进制格式存储,这意味着数字有时会以极高的精度级别舍入。您可以使用 ROUND 函数(请参见数字函数)或者通过将数字格式设置为显示较少小数位来消除这种潜在误差。

ATTR语法ATTR(expression)定义如果它的所有行都有一个值,则返回该表达式的值。否则返回星号。会忽略 Null 值。AVG语法AVG(expression)定义返回表达式中所有值的平均值。会忽略 Null 值。说明AVG 只能用于数字字段。COLLECT语法COLLECT(spatial)定义将参数字段中的值组合在一起的聚合计算。会忽略 Null 值。说明COLLECT 只能用于空间字段。CORR语法CORR(expression1, expression2)输出从 -1 到 1 的数字定义返回两个表达式的皮尔森相关系数。示例example说明

皮尔森相关系数衡量两个变量之间的线性关系。结果范围为 -1 至 +1(包括 -1 和 +1),其中 1 表示精确的正向线性关系,0 表示方差之间没有线性关系,而 −1 表示精确的反向关系。

CORR 结果的平方等于线性趋势线模型的 R 平方值。请参见“趋势线模型术语”(链接在新窗口中打开)。

与表范围 LOD 表达式一起使用:

您可以使用 CORR,通过表范围的详细级别表达式(链接在新窗口中打开)来可视化解聚散点图中的相关性。例如:

{CORR(Sales, Profit)}

借助详细级别表达式,关联将在所有行上运行。如果您使用像 CORR(Sales, Profit)(不带两边的方括号可使其成为详细级别表达式)这样的公式,视图将显示散点图中每个单独的点与其他每个点(未定义)的关联。

数据库限制

CORR适用于以下数据源:Tableau 数据提取、Cloudera Hive、EXASolution、Firebird(版本 3.0 及更高版本)、Google BigQuery、Hortonworks Hadoop Hive、IBM PDA (Netezza)、Oracle、PostgreSQL、Presto、SybaseIQ、Teradata、Vertica。

对于其他数据源,请考虑提取数据或使用 WINDOW_CORR。请参见“表计算函数”(链接在新窗口中打开)。

COUNT语法COUNT(expression)定义返回项目数。不对 Null 值计数。COUNTD语法COUNTD(expression)定义返回组中不同项目的数量。不对 Null 值计数。COVAR语法COVAR(expression1, expression2)定义返回两个表达式的样本协方差。说明

协方差对两个变量的共同变化方式进行量化。正协方差指明两个变量趋向于向同一方向移动,平均来说,即一个变量的较大值趋向于与另一个变量的较大值对应。样本协方差使用非空数据点的数量 n - 1 来规范化协方差计算,而不是使用总体协方差(可用于 COVARP 函数)所使用的 n。当数据是用于估算较大总体的协方差的随机样本时,则样本协方差是合适的选择。

如果 和 相同(例如, COVAR([profit], [profit])),COVAR 将返回一个值,指明值分布的广泛程度。

COVAR(X, X) 的值等于 VAR(X)的值,也等于 STDEV(X)^2 的值。

数据库限制

COVAR适用于以下数据源:Tableau 数据提取、Cloudera Hive、EXASolution、Firebird(版本 3.0 及更高版本)、Google BigQuery、Hortonworks Hadoop Hive、IBM PDA (Netezza)、Oracle、PostgreSQL、Presto、SybaseIQ、Teradata、Vertica。

对于其他数据源,请考虑提取数据或使用 WINDOW_COVAR。请参见“表计算函数”(链接在新窗口中打开)。

COVARP语法COVARP(expression 1, expression2)定义返回两个表达式的总体协方差。说明

协方差对两个变量的共同变化方式进行量化。正协方差指明两个变量趋向于向同一方向移动,平均来说,即一个变量的较大值趋向于与另一个变量的较大值对应。总体协方差等于样本协方差除以 (n-1)/n,其中 n 是非空数据点的总数。如果存在可用于所有相关项的数据,则总体协方差是合适的选择,与之相反,在只有随机项子集的情况下,样本协方差(及 COVAR 函数)较为适合。

如果 和 相同(例如, COVARP([profit], [profit])),COVARP 将返回一个值,指明值分布的广泛程度。注意:COVARP(X, X) 注意:的值等于 VARP(X)的值,也等于 STDEVP(X)^2 的值。

数据库限制

COVARP 适用于以下数据源:Tableau 数据提取、Cloudera Hive、EXASolution、Firebird(版本 3.0 及更高版本)、Google BigQuery、Hortonworks Hadoop Hive、IBM PDA (Netezza)、Oracle、PostgreSQL、Presto、SybaseIQ、Teradata、Vertica

对于其他数据源,请考虑提取数据或使用 WINDOW_COVAR。请参见“表计算函数”(链接在新窗口中打开)。

MAX语法MAX(expression) 或 MAX(expr1, expr2)输出与参数相同的数据类型,或者,如果参数的任何部分为 null,则为 NULL 。定义

返回两个参数(必须为相同数据类型)中的最大值。

MAX 也可以聚合形式应用于单个字段。

示例MAX(4,7) = 7MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021# MAX([Name]) = "Zander"说明

对于字符串

MAX 通常是按字母顺序排在最后的值。

对于数据库数据源,MAX 字符串值在数据库为该列定义的排序序列中最高。

对于日期

对于日期,MAX 是最近的日期。如果 MAX 是聚合,结果不会有日期层次结构。如果 MAX 是比较,结果将保留日期层次结构。

作为聚合

MAX(expression) 是聚合函数,返回单个聚合结果。这在可视化项中显示为 AGG(expression)。

作为比较

MAX(expr1, expr2) 比较这两个值并返回一个行级值。

另请参见 MIN。

MEDIAN语法MEDIAN(expression)定义返回表达式在所有记录中的中位数。会忽略 Null 值。说明MEDIAN 只能用于数字字段。数据库限制

MEDIAN 适用于以下数据源:Access、Amazon Redshift、Cloudera Hadoop、HP Vertica、IBM DB2、IBM PDA (Netezza)、Microsoft SQL Server、MySQL、SAP HANA、Teradata。

对于其他数据源类型,可以将数据提取到数据提取文件以使用此函数。请参见提取数据(链接在新窗口中打开)。

MIN语法MIN(expression) 或 MIN(expr1, expr2)输出与参数相同的数据类型,或者,如果参数的任何部分为 null,则为 NULL 。定义

返回两个参数(必须为相同数据类型)中的最大值。

MIN 也可以聚合形式应用于单个字段。

示例MIN(4,7) = 4MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986#MIN([Name]) = "Abebi"说明

对于字符串

MIN 通常是按字母顺序排列在前面的值。

对于数据库数据源,MIN 字符串值在数据库为该列定义的排序序列中最低。

对于日期

对于日期,MIN 是最早的日期。如果 MIN 是聚合,结果不会有日期层次结构。如果 MIN 是比较,结果将保留日期层次结构。

作为聚合

MIN(expression) 是聚合函数,返回单个聚合结果。这在可视化项中显示为 AGG(expression)。

作为比较

MIN(expr1, expr2) 比较这两个值并返回一个行级值。

另请参见 MAX。

PERCENTILE语法PERCENTILE(expression, number)定义从给定表达式返回与指定 对应的百分位处的值。 必须介于 0 到 1 之间(含 0 和 1),并且必须是数值常量。示例PERCENTILE([Score], 0.9)说明 数据库限制

此函数可用于以下数据源:非旧版 Microsoft Excel 和文本文件连接、数据提取和仅数据提取数据源类型(例如 Google Analytics、OData 或 Salesforce)、Sybase IQ 15.1 及更高版本数据源、Oracle 10 及更高版本的数据源、Cloudera Hive 和 Hortonworks Hadoop Hive 数据源、EXASolution 4.2 及更高版本的数据源。

对于其他数据源类型,可以将数据提取到数据提取文件以使用此函数。请参见提取数据(链接在新窗口中打开)。

STDEV语法STDEV(expression)定义基于群体样本返回给定表达式中所有值的统计标准差。STDEVP语法STDEVP(expression)定义基于有偏差群体返回给定表达式中所有值的统计标准差。SUM语法SUM(expression)定义返回表达式中所有值的总计。会忽略 Null 值。说明SUM 只能用于数字字段。VAR语法VAR(expression)定义基于群体样本返回给定表达式中所有值的统计方差。VARP语法VARP(expression)定义对整个群体返回给定表达式中所有值的统计方差。创建聚合计算

按照下面的步骤进行操作以了解如何创建聚合计算。

在 Tableau Desktop 中,连接到 Tableau 附带的示例 - 超市已保存数据源。

导航到工作表,并选择“分析”>“创建计算字段”。

在打开的计算编辑器中,执行以下操作:

将计算字段命名为“Margin”(利润)。

输入以下公式:

IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)

注意:您可以使用函数引用来查找聚合函数和其他函数(如此示例中的逻辑 IIF 函数),并将其添加到计算公式。有关详细信息,请参见在计算编辑器中使用函数引用。

完成后,单击“确定”。

新的聚合计算将出现在“数据”窗格中的“度量”下。就像其他字段一样,您可以在一个或多个可视化项中使用该字段。

注意:聚合计算始终为度量。

当将“Margin”(利润)放在工作表中的功能区或卡上时,它的名称将更改为“AGG(Margin)”,表示它是聚合计算,并且无法进一步聚合。

聚合计算的规则

适用于聚合计算的规则如下:

任何聚合计算中不得同时包括聚合值和解聚值。例如,SUM(Price)*[Items] 不是有效的表达式,因为 SUM(Price) 已聚合,而 Items 则没有。不过,SUM(Price*Items) 和 SUM(Price)*SUM(Items) 均有效。

表达式中的常量可根据情况充当聚合值或解聚值。例如:SUM(Price*7) 和 SUM(Price)*7 均为有效的表达式。

所有函数都可用聚合值进行计算。但是,任何给定函数的参数必须或者全部聚合,或者全部解聚。例如:MAX(SUM(Sales),Profit) 不是有效的表达式,因为 Sales 已聚合,而 Profit 则没有。不过,MAX(SUM(Sales),SUM(Profit)) 为有效的表达式。

聚合计算的结果始终为度量。

与预定义聚合一样,聚合计算可正确地进行总计计算。有关详细信息,请参见“总计”。

另请参见

了解计算:聚合计算(链接在新窗口中打开)

Tableau 中的数据聚合(链接在新窗口中打开)

Tableau 中的函数

Tableau 函数(按类别)(链接在新窗口中打开)

Tableau 函数(按字母顺序)



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有